Enter 2006 September

home *** CD-ROM | disk | FTP | other *** search

/ Enter 2006 September / Enter 09 2006.iso / Internet / SpamExperts Home 1.1 / SpamExperts Home.exe / lib / spamexperts.modules / encodings / punycode.pyc (.txt) < prev next >

Wrap

Python Compiled Bytecode | 2006-07-14 | 6.7 KB | 246 lines

# Source Generated with Decompyle++ # File: in.pyc (Python 2.4) ''' Codec for the Punicode encoding, as specified in RFC 3492 Written by Martin v. L\xf6wis. ''' import codecs def segregate(str): '''3.1 Basic code point segregation''' base = [] extended = { } for c in str: if ord(c) < 128: base.append(c) continue extended[c] = 1 extended = extended.keys() extended.sort() return (''.join(base).encode('ascii'), extended) def selective_len(str, max): '''Return the length of str, considering only characters below max.''' res = 0 for c in str: if ord(c) < max: res += 1 continue return res def selective_find(str, char, index, pos): '''Return a pair (index, pos), indicating the next occurrence of char in str. index is the position of the character considering only ordinals up to and including char, and pos is the position in the full string. index/pos is the starting position in the full string.''' l = len(str) while None: pos += 1 if pos == l: return (-1, -1) c = str[pos] if c == char: return (index + 1, pos) continue if c < char: index += 1 continue def insertion_unsort(str, extended): '''3.2 Insertion unsort coding''' oldchar = 128 result = [] oldindex = -1 for c in extended: index = pos = -1 char = ord(c) curlen = selective_len(str, char) delta = (curlen + 1) * (char - oldchar) while None: (index, pos) = selective_find(str, c, index, pos) if index == -1: break delta += index - oldindex oldindex = index delta = 0 oldchar = char return result def T(j, bias): res = 36 * (j + 1) - bias if res < 1: return 1 if res > 26: return 26 return res digits = 'abcdefghijklmnopqrstuvwxyz0123456789' def generate_generalized_integer(N, bias): '''3.3 Generalized variable-length integers''' result = [] j = 0 while None: t = T(j, bias) if N < t: result.append(digits[N]) return result N = (N - t) // (36 - t) j += 1 def adapt(delta, first, numchars): if first: delta //= 700 else: delta //= 2 delta += delta // numchars divisions = 0 while delta > 455: delta = delta // 35 divisions += 36 bias = divisions + 36 * delta // (delta + 38) return bias def generate_integers(baselen, deltas): '''3.4 Bias adaptation''' result = [] bias = 72 for points, delta in enumerate(deltas): s = generate_generalized_integer(delta, bias) result.extend(s) bias = adapt(delta, points == 0, baselen + points + 1) return ''.join(result) def punycode_encode(text): (base, extended) = segregate(text) base = base.encode('ascii') deltas = insertion_unsort(text, extended) extended = generate_integers(len(base), deltas) if base: return base + '-' + extended return extended def decode_generalized_number(extended, extpos, bias, errors): '''3.3 Generalized variable-length integers''' result = 0 w = 1 j = 0 while None: try: char = ord(extended[extpos]) except IndexError: if errors == 'strict': raise UnicodeError, 'incomplete punicode string' return (extpos + 1, None) extpos += 1 if char <= char: pass elif char <= 90: digit = char - 65 elif char <= char: pass elif char <= 57: digit = char - 22 elif errors == 'strict': raise UnicodeError("Invalid extended code point '%s'" % extended[extpos]) else: return (extpos, None) t = T(j, bias) result += digit * w if digit < t: return (extpos, result) w = w * (36 - t) j += 1 def insertion_sort(base, extended, errors): '''3.2 Insertion unsort coding''' char = 128 pos = -1 bias = 72 extpos = 0 while extpos < len(extended): (newpos, delta) = decode_generalized_number(extended, extpos, bias, errors) if delta is None: return base pos += delta + 1 char += pos // (len(base) + 1) if char > 1114111: if errors == 'strict': raise UnicodeError, 'Invalid character U+%x' % char char = ord('?') pos = pos % (len(base) + 1) base = base[:pos] + unichr(char) + base[pos:] bias = adapt(delta, extpos == 0, len(base)) extpos = newpos return base def punycode_decode(text, errors): pos = text.rfind('-') if pos == -1: base = '' extended = text else: base = text[:pos] extended = text[pos + 1:] base = unicode(base, 'ascii', errors) extended = extended.upper() return insertion_sort(base, extended, errors) class Codec(codecs.Codec): def encode(self, input, errors = 'strict'): res = punycode_encode(input) return (res, len(input)) def decode(self, input, errors = 'strict'): if errors not in ('strict', 'replace', 'ignore'): raise UnicodeError, 'Unsupported error handling ' + errors res = punycode_decode(input, errors) return (res, len(input)) class StreamWriter(Codec, codecs.StreamWriter): pass class StreamReader(Codec, codecs.StreamReader): pass def getregentry(): return (Codec().encode, Codec().decode, StreamReader, StreamWriter)